- 快捷搜索
- 全站搜索
近年来,金融业务范围逐步扩展、IT系统结构日趋复杂、科技监管标准不断提高,各家银行都面临着保障IT系统安全、可靠运营的巨大挑战。建设安全可靠的IT运营体系是一项复杂的系统性工作,包含多方面的工作内容,而建设全面、有效的监控系统是其中不可或缺的部分。
全面、有效的监控系统应包含机房监控、网络监控、系统监控、应用监控四个主要技术领域。伴随监控技术的发展,机房监控、网络监控和系统监控技术领域都出现了较成熟的监控工具产品,银行数据中心依托这些监控工具也相继建成了相对完善的监控系统。
在应用监控方面,由于应用系统的技术平台、业务功能和开发实现千差万别,因此不可能通过简单部署通用的应用监控工具来直接进行应用系统监控,这就给应用监控的实现造成了较大困难。然而,相对于机房监控、网络监控和系统监控,应用监控是面向服务、面向客户的监控,可以反映客户服务体验,对于银行数据中心有效管理对外服务水平的意义和价值更大。
一、主要技术原理
1.应用监控实现方法
面对应用监控存在的困难,通常有两类解决方法。一类是在不修改应用代码和不部署应用监控手段的条件下,利用其他监控手段间接实现应用监控;另一类则是通过应用代码修改和应用监控手段相结合的方式,直接实现应用监控。
间接实现应用监控有两种常见方法。一是利用系统监控指标与应用监控指标的映射实现监控,如通过系统交易映射应用交易、通过数据库表大小映射应用数据量变化、通过网络端口映射应用端口等,在发生系统异常时同时产生对应的应用异常;二是依据应用系统架构进行应用影响分析,系统异常发生时通过应用系统架构和影响推断算法,得出相关应用是否受到影响及影响范围。这两类问接监控手段可以在一定程度上反映应用执行情况,但在实现过程中由于部分应用指标无法准确对应、架构描述细粒度不够、推断算法不精确等原因,其监控结果在完整性和准确性方面存在欠缺,不能有效满足银行数据中心的应用监控要求。
直接实现应用监控也主要有两种方法。一是应用修改代码增加异常日志后,开发或部署监控工具通过读取这些异常信息实现监控。二是按照应用响应测量(Application Response Measurement,ARM)技术标准获取应用相关信息,开发或部署监控工具,读取相关信息并进行融合处理形成应用交易执行情况监控。前者主要适用于单一平台的交易或批量异常监控,是一种基于事件的监控手段;后者主要适用于分布式系统的跨平台交易执行情况监控,是一种对应用交易从发起端到执行端的全过程监控手段,简称为端到端应用交易监控,是本文主要探讨的应用交易监控技术。
2.ARM技术标准
ARM技术标准最早由IT企业于1996年提出并发布1.0版,后续由开放组织(Open Group)进行优化修改并陆续发布了多个版本,目前的最新版本是4.1版。ARM技术标准的提出是为了解决应用监控中关注的几个核心问题,包括交易是否成功执行、交易失败的问题点在哪里、终端用户感受的交易响应时问是多少、交易哪个环节耗时过长、交易执行的次数和成功率是多少等。
ARM技术标准的基本原理是向应用提供标准的ARM API函数,应用在交易开始和结束时,通过调用ARM API函数将交易执行的关键信息传递给ARM代理,再由ARM代理将数据发送给后台的监控服务器,监控服务器进行数据处理后实现监控。其原理如图1所示。

ARM API提供6个标准函数,用于实现应用交易监控。其函数功能如表1所示。

ARM API提供的6个标准函数可顺序进行调用。其调用顺序如图2所示(椭圆内为一次交易实例中的调用顺序)。

针对普遍存在的分布式应用系统和跨应用交易调用,ARM技术标准也提供了交易链监控方法,可实现分布式交易的响应时间关联。其基本原理如图3所示。

该场景的执行过程如下。
(1)客户端发起应用一上的交易A,交易A在开始时调用ARMAPI函数,并向ARM代理发送交易执行关键信息。
(2)应用一的交易A发起应用二的交易B,并传递关联标识1(可唯一标识交易A)。
(3)应用二的交易B在开始时调用ARM API函数,并向ARM代理发送含关联标识1的交易执行关键信息。
(4)应用二的交易B发起应用三的交易C,并传递关联标识2(可唯一标识交易B)。
(5)应用三的交易C在开始时调用ARM API函数,并向ARM代理发送含关联标识2的交易执行关键信息。
(6)应用三的交易c在结束时调用ARM API函数向ARM代理发送交易执行关键信息,并返回应用二的交易B。
(7)应用二的交易B在结束时调用ARM API函数向ARM代理发送交易执行关键信息,并返回应用一的交易A。
(8)应用一的交易A在结束时调用ARM API函数向ARM代理发送交易执行关键信息,并返回客户端。
监控服务器在收集到ARM代理发送的6条信息后,不但可以计算出交易A、B、C的响应时间,还能形成交易A、B、C逐层发起的关联关系,形成对由交易A、B、C构成交易链的分段响应时间监控。
3.产品技术实现
ARM技术标准诞生后,多家IT企业进行了产品化实现,其中ITCAM for Transaction是一款实现应用交易追踪和应用响应监控的工具产品组合,其在交易追踪方面提供的TTAPI(Transaction Tracking Application Programming Interface)函数可以理解为ARM技术标准的优化发展和产品实现。
商业银行发展互联网金融,其实对既有的技术体系规划和设计提出了新的要求。
商业银行发展互联网金融,其实对既有的技术体系规划和设计提出了新的要求。